1
確率とデータをつなぐ
AI014Lesson 5
00:00

原始的な観測値を構造化された Rオブジェクト に変換することは、確率的解析に必要な技術的な処理プロセスです。分布モデルの構築の前に、 データインジェスト リスト、行列、データフレーム間の構造的な違いを理解する必要があります。

1. 構造的なインジェスト

データを scan() はしばしば ダミーリスト構造 を定義するために必要です(例: list(id="", x=0))。これにより、 input.dat のようなファイルからの外部データが、フラットなベクトルではなく管理しやすいコンポーネントにパースされることが保証されます。

2. 次元の整理

一方で、 行列 は同質な数値データセットに使用され( byrow=TRUEを使用して)、 data.frame() は統計モデリングの決定的な橋渡しとして機能し、異種のデータ型が共存できるようにします。

原始ファイルリスト/行列確率分布

3. 変数へのアクセス性

推論用データにアクセスするには、 inp[[1]] または inp$idのような名前付き列によるインデックス指定が必要です。 attach() 関数は、 全体オブジェクト (例: eruptions)内の変数を繰り返しインデックス指定せずに直接アクセスできるようにします。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>